CTR 预估算法之 LR

伴随着我们浏览器及其矩阵产品用户规模的扩大，单纯的广告接入，然后随机的展示方式无法充分利用我们的广告位，无法达到收益最大化。随着调研的深入，点击率预估模型便提上了日程。

经过前期一个月数据的收集准备，目前的数据量已经能够满足模型的开展了。接下来便会总结一些列关于 CTR 模型相关的知识，当然这里只对相应算法铺开，限于商业数据的保密性，不对具体数据和实施细节做展开。

我们的模型周级更新，大概结构如下：

系统整体结构图如上，分为 offline 线下部分和 online 线上部分。线下部分，取前一周的 PV 和 click 日志作为增量训练数据，更新迭代模型；线上部分，利用训练好的模型，接受用户请求，检索广告库（我们的广告库来自于 Applovin，Yeahmobi，Mobvista 等广告商，天级更新存放在数据库里），组合特征，过 CTR，最终取 cpm 最高的广告进行展示。